kaggle是全世界公認最大的資料科學社群,上面有許多資料分析或資料科學的比賽,除此之外還有一個Dataset專區,裡面提供很多不同的資料集給大家下載,這要就可以省下爬蟲這類搜集資料的時間。
https://www.kaggle.com/datasets
Kaggle的目標則是試圖通過眾包的形式來解決這一難題,進而使數據科學成為一場運動。
**內容分享和學習:**Kaggle成員可以通過發表內容,如數據分析、教程、Notebooks 等,來分享他們的知識和經驗。
**Kaggle Notebooks:**這是一個交互式編碼環境,可以直接在瀏覽器中運行程式碼,不需要安裝任何軟體。讓共享程式碼和結果變得更加方便容易。
**討論區和論壇:**Kaggle社群有一個討論區,可以在這裡尋求幫助、討論問題,也可以參與各種討論主題。
**Kaggle Datasets 和 Kernels:**可以在Kaggle上發表和分享自己的數據集,也可以分享程式碼。
**獎勵和排名:**在Kaggle上參與競賽、分享內容在社群可以獲得積分。
https://www.kaggle.com/search?q=titanic+in%3Adatasets+datasetFileTypes%3Aipynb+datasetFileTypes%3Acsv
可以透過kaggle看到跟鐵達尼有關的很多資料集